Les émissions de CO2 causent des problèmes majeurs, de nos jours, tels que: le réchauffement climatique, la destruction de la couche d’ozone, etc. Ce qui a des conséquences néfastes sur notre planète et les êtres qui y vivent.
Nous essaierons à travers ce projet d’analyser les émissions de CO2 par pays en fonction du temps et du PIB par habitant en parité de pouvoir d’achat. Nous contrôlerons cet indicateur économique par d’autres variables principalement associées à la manière de produire et consommer notre énergie.
La collecte des données est une étape incontournable pour répondre à notre problématique.
Nous avons pu faire cette étape grâce aux données disponibles sur le site de la banque mondiale: https://databank.worldbank.org/source/world-development-indicators.
Ces données sont composées de 1500 observations et 11 variables, qui sont:
Cependant, les données collectées requièrent un traitement avant de pouvoir les utiliser.
La base de données présentait de nombreuses données manquantes les années les plus récentes. De ce fait nous avons choisi de ne conserver que les années de 2003 à 2014. Ce choix nous a permis de conserver quasiment la totalité des pays du monde même après suppression des données manquantes.
Enfin, nous avons défini des variables logarithmiques telles que (log(GDP_PPP) et log(CO2_emissions)).
Nous nous retrouvons donc avec des données en Panel (axe pays et axe temps).
=================================================================
Statistic N Mean St. Dev. Min Max
-----------------------------------------------------------------
Time 1,500 2,008.500 3.453 2,003 2,014
GDP_PPP 1,500 22,540.070 21,299.750 708.029 120,647.800
CO2_emissions 1,500 5.707 6.331 0.035 47.657
Agricultural_land 1,500 39.557 20.844 0.449 85.287
Clean_energy 1,500 7.643 10.533 0.000 55.577
Electric_power 1,500 4,337.439 5,819.712 23.916 54,799.180
log_GDP_PPP 1,500 9.527 1.095 6.562 11.701
log_GDP_PPP_2 1,500 91.962 20.408 43.066 136.905
log_CO2 1,500 1.029 1.417 -3.341 3.864
-----------------------------------------------------------------
Après avoir traité les données, nous avons une base contenant 10 variables et 1500 observations. En effet, sur le tableau ci-dessus, une des variables est absente car c’est celle qui représente les différents pays (chaine de caractère).
On remarque sur notre base:
Toutes ses informations nous reconfortent sur la diversité des données dont on dispose.
Notre base de données contient des pays du monde. De ce fait, Nous avons pensé à identifier les pays et à permettre une observation sur carte des disparités.